parallelization相关论文
针对传统串行空间碎片探测软件 DEBIE 存在的无法有效并行执行问题,设计和实现了 DEBIE 并行软件及 WCRT 计算方法。该并行设计采用......
分辨率的增加使得数值预报系统的运行时间大大增加,对预报业务的时效性带来了很大的挑战.以往满足时效性需求的串行程序往往因为耗......
针对多视频流解码和显示时CPU占用率过高等问题。设计了基于统一计算设备架构(CUDA)平台上的GPU多视频流并行化处理方案,定义了表示G......
为了解决传统串行朴素贝叶斯算法分类性能低下的问题,提出一种基于朴素贝叶斯算法的并行化分类方法。选取多项式朴素贝叶斯,搭建Ha......
CUDA是GPU通过并发执行多个线程以实现大规模快速并行计算能力的技术,它能使对GPU编程变得更容易。介绍了CUDA基本特性及主要编程......
随着CPU多核架构的普及,应用的复杂和数据集的膨胀,基于Matlab的遗留系统中的串行程序代码无法充分发挥系统潜在的性能优势,无力应......
分析讨论了分子动力学模拟的算法特征和计算特点,对串行程序作了优化,并使之适合于作并行化。对模拟体系使用区域分解的方法,在计......
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制......
为了解决天文图像相减测光存在的性能问题,满足特殊条件下天文观测的实时性要求,在充分分析原始测光算法整体性能的基础上,结合CUD......
针对传统串行空间碎片探测软件DEBIE存在的无法有效并行执行问题,设计和实现了DEBIE并行软件及WCRT计算方法。该并行设计采用处理......
针对传统决策树分类算法需要依靠人工构造特征才能实现对数据进行分类的问题,以及其在处理海量天文数据时所面临的处理速度和资源......
作业管理一直是网格技术中的热点问题,其中对于作业的描述是作业管理中的首要任务。本文针对作业描述展开分析,设计基于任务通信的......
随着人类基因组测序的完成,将序列比对到基因组序列之上成为研究序列功能结构的一种重要方法。sim4程序是目前比较流行的序列剪接比......
中图分类号:TN929.1 文献标志码:A 文章编号:1009-6868 (2015) 05-0032-003 摘要:半监督多视图学习是机器学习领域一种极具潜力的大数......
非规则Doacross循环包含复杂数据流以及控制流引起的不确定依赖关系,传统并行化技术对其采取保守处理,错失不少并行机会。文章提出一......
传统计算机算法在大数据环境下效率较差。为此,从数据处理并行角度出发探索大数据环境下实现先进先出的新算法逻辑,通过先进先出算......
文本分类是信息检索与数据挖掘的研究热点与核心技术,近年来得到了广泛的关注和快速的发展。近来年随着文本数据呈指数增长,要有效......
GFSR是一种反馈移位随机数发生器.在研究GFSR(521,32)串行算法的基础上,利用Strided skip ahead方法对其进行并行化.实验结果显示,GF......
自适应方向提升小波变换(ADL)利用图像纹理特征进行变换编码,从而获得更高的编码质量,但同时也增加了计算复杂度。为了提高图像编......
放射治疗计划系统(TPS)是为放疗患者制定放疗计划的特殊系统,对放射治疗的精度和效果有重要影响,是放射治疗的核心技术之一。数字......
MCMC(Markov Chain Monte Carlo,MCMC)方法采用顺序改变表征像素类属性的标号变量值会导致算法运算时间长、收敛速度慢等问题。为此,......
为了协助供电公司对用电客户的行为进行准确描述,进一步指导发电端合理、有效地调整发电策略,提出了一种基于SparkR的并行化K-mean......
采用AP聚类算法进行复杂网络社团挖掘,提高了社团挖掘的精度,但在处理海量数据时算法速率明显下降,其中一个重要原因是单台计算机......
程序可以看作由很多计算组成(例如一个循环或一个平直代码片断),它们彼此相关或者无关,共同为计算最终的结果服务,其中彼此不相关的......
边缘海静力数值模式是国内针对边缘海特点自主开发的数值预报模式,但该模式因物理求解方程较多且采用不宜并行化的SOR求解算法而程......
针对CFD(Computational Fluid Dynamics)程序中常见的自相关循环结构,分析了波前并行技术不能对其进行并行化的原因,针对其相关实......
针对智能电网大数据环境下,支持向量机在功率预测时模型的预测精度和系统运行时间受到限制的问题,提出了运用MapReduce计算框架将......
本文基于企业微博主题分析,提出一种大规模作者主题模型训练的并行化思想,继而提出相应的采样算法,并在此基础之上针对其采样复杂......
针对传统的文本分类方法费时且占用大量资源、效率低等问题,提出了结合大数据处理平台Hadoop和中文文本分类,实现支持向量机(SVM)算......
针对当前需要对海量的文本数据进行分类和用于训练的带标记的文本数据非常匮乏这两个问题,结合半监督的朴素贝叶斯分类算法和Map—R......
针对在绘制具有真实感的图形中光照处理模块串行处理速度慢的问题,提出多光源光照算法的并行化,采用负载均衡的并行策略,重新优化......
合理的数学地质方法模型可以预测到深部矿产资源富集位置,矿产资源数据格式多样,传统的方法难以进行有效处理,并且处理方式大多基......
针对组合式线性同余产生器,在众核平台上给出一种并行化设计。该设计依据组合式线性同余产生器串行算法原理,将组合式线性同余产生......
cmseareh程序是目前最流行的同源RNA搜索工具之一,其最大的缺陷在于搜索速度过慢,严重影响了其应用范围。文章基于序列划分策略采用......
针对多核硬件结构出现后时间耗费型的约束求解问题具有并行求解能力的问题,分析回溯搜索算法和相容技术,提出并行相容和并行搜索结......
基于云计算平台Hadoop的主要功能和MapReduce处理流程,设计FCM算法的并行化处理过程。...
本文探讨了不交乘积和方法的并行性提取问题,提出了不交乘积和方法并行计算的基本框架,实现了一种不交乘积和算法的并行化版本.测......
在解决许多实际问题时,经常需要计算一些高阶矩阵。然而传统的串行计算方法往往效率比较低。因此,需将串行程序并行化来提高计算效率......
在生物信息学中,蛋白质序列比对是最为重要的算法之一,生物技术的发展使得已知的序列库变得越来越庞大,这类算法本身又具有计算密集型......
实现了风暴潮数值模式基于MPI的并行化;根据该模式数值计算的特点提出了一种并行求解三对角方程组的新方法,相对于传统算法编程简......
CUDA是应用较广的GPU通用计算模型,BP算法是目前应用最广泛的神经网络模型之一。提出了用CUDA模型并行化BP算法的方法。用该方法训......
为了提高卷积算法在矢量数字信号处理器(DSP)上的执行效率,提出了一种高效的并行化卷积算法——基2并行短卷积(PSCR2)算法。该算法采用......
设计了基于空穴-粒子对称的并行化组态相互作用程序,并在一个有12个结点的计算机集群上测试了程序的运行.测试表明,程序的并行化基......
根据集群的特点和聚类的特性,从理论上探讨了聚类并行化的可行性,并在此基础上用实验进行了验证,结果表明通过这些改进能够获得比......
基于字符串匹配的检测方法是入侵检测系统(IDS)中一类很重要的分析方法,文章分析了著名的BM模式匹配算法,提出了一种新的字符匹配......
随着数据处理规模的不断扩大,对算法执行效率的要求不断提高。Spark作为基于内存计算的分布式并行化框架得到了前所未有的关注和广......
CLCG4是线性同余随机数发生器中的一种,因其周期长且随机性好被广为应用,但其缺点是产生随机数速度较慢的问题。针对这一问题文中......
给出了一种适用于混合网格的并行无矩阵GMRES+LU-SGS隐式时间格式。首先采用LU-SGS方法迭代若干步以获得一个合适的初场,然后切换......
自行研制的三维并行全电磁PIC模拟软件UNIPIC-3D具有模拟高功率微波器件的能力。软件实现了并行的三维FDTD、粒子推进算法以及边界......